在做數據分析的過程中,經常會想數據分析到底是什麼?為什麼要做數據分析?數據分析到底該怎麼做?等這些問題。對於這些問題,小數一開始也只是有個很籠統的認識。
最近這兩天我又重新讀了一遍早就被很多人推薦的《誰說菜鳥不會數據分析》這本書。發現對這些問題講的還是比較透徹,隨後對這本書的核心內容做了一個筆記。
說明:筆記主要以思維導圖的方式呈現。
數據分析指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解並消化,以求最大化地開發資料的功能,發揮資料的作用。
主要講數據分析的方法論,如何利用管理學、行銷學等知識從宏觀上指導資料分析的過程,為的是明確分析的目的和思路,以免南轅北轍,分析了很久卻不能解決要面臨的問題。
其中PEST用於對行業的宏觀環境分析,5W2H可以用於用戶的行為、業務問題分析、邏輯樹可以將某業務問題拆分為子問題進行專題分析、4P是一種行銷理論,用來信進行公司產品的運營情況分析、使用者行為分析可以用來分析各級指標之間的邏輯關係。
「巧婦難為無米之炊」。資料就好比諺語中的米。做為數據分析師更是應該知道「米」的兩個方面。第一:“米的構造”「理解資料」,第二“米”從哪裡「資料來源」。
在做資料分析之前需要將資料清洗、加工、轉換等一些步驟以使得資料成為可以用於建模分析的規整數據。
當完成資料的處理之後,現在需要真正的從細節上對數據進行分析,並且在微觀上也有一套比較固定的分析方法可供參考使用。
當數據分析的工作完成之後,需要對分析結果進行視覺化展示及美化。
數據分析報告是對整個資料分析過程的一個總結和呈現。透過報告,把數據分析的起因、過程、及結果完整的展現出來、提供給決策者參考。
其實入門數據分析並不難。但想成為優秀的數據分析師並不容易。首先要過硬的資料技能,其次要有敏銳的商業嗅覺,再次是流暢的溝通和表達能力,最後不斷地實踐這些能力,在實戰中應對商業的變化,提升分析能力,從而發揮在業務端的價值,甚至產生你的影響(make business impact)。
關於“數據分析”(Data Analyst)這一職位,通常一定規模的外企和國內的互聯網、IT、金融等行業會設有專門的數據分析崗位,也有著不錯的發展路徑。而在一個公司裡面,資料分析師可以存在於不同的部門,銷售支持,財務,市場研究,R&D等。但每個部門的側重點也是不一樣的,我原來在銷售支援部門,雖說是資料分析,但理解業務,與銷售端交流是很重要的。但如果是在R&D,技能上的程式設計要求,對架構的理解可能更重要。
資料分析最擅長的工具一定包括Excel,通常好的資料分析師一定是一個非常非常專業的Excel使用者,這其中包括了對Excel常用公式和功能的理解及使用(樞紐分析表,各種圖表等)。其實掌握Excel基本功能也是很多其他崗位(Marketing,Finance等職位)的必須。作為一款資料處理的基礎工具,市面上有太多的Excel教程。我個人的建議,可以從一本書+視頻教程+自我練習的方法來入門或者進階。
Excel更進階的另一個大技能是VBA,它是以Visual Basic為基礎的程式設計語言。但,掌握或者使用並不需要太強的程式設計背景。這也是為什麼知乎上很多用戶推薦用VBA作為高階Excel的技能。VBA用的好可以玩轉各大金融投行,諮詢公司的資料處理自動化,報表批量產出等。VBA的優勢是跟Excel的無縫銜接,能夠用簡單的程式設計實現資料自動化,或者金融模型實現,預測分析。即使在今天Python、R非常火熱的資料採擷,資料科學領域,仍然有不少公司選擇使用VBA。
另一大資料技能就是SQL, SQL和Excel已經成為這一崗位在發佈職位時的標配了。SQL是結構化查詢語言,對接的是後臺較大較系統化的資料庫。它的優勢是基於不同邏輯的資料抓取會很方便和有效率。基本的語法其實並不難,會使用join table、sub query,case when、rank這些功能其實不是太難,難點在於通過不同的練習,訓練出一個良好的邏輯思考能力。簡言之,就是知道什麼商業需求可以實現,哪些需求需要更久的時間。此外,對業務的理解也至關重要,千萬不要小看這個簡單的資料抓取,好的SQL實現者一定是對業務理解透徹,事半功倍的。
如果致力於從事資料分析工作,那除了掌握Excel, VBA,SQL之外,還需緊跟趨勢,學習最新技能,但同時也得夯實基礎。記得本科畢業的時候,跟現在2019年同樣一個資料分析職位的JD是完全不一樣的。而且公司或者業務層面對資料分析的重視程度也不一樣。建議要不斷更新自己的技能儲備,至少瞭解現在在發生著什麼,什麼是基礎,什麼是進階。這裡更想強調一下對資料和商業的理解。一般三年以內可能還是在磨練技術,過了三年就開始思考更深一層的東西,就是在有了“術”的基礎上,往“道”的方向思考。
理解資料並非易事,至少需要幾年經驗的。通常在掌握了基本技能並且熟練使用的基礎上,加上累積的商業實踐,一般來講都會產生一種資料直覺。具體體現在:第一:當遇到一個資料需求會先分析,而不是上手就做,因為有時候需求並不合理。第二:會評估不同資料專案的時間進度和回饋頻率,新手很容易不溝通,很難地做了很長時間之後發現結果不是用戶想要的。第三:當出現不合理的資料時第一時間能夠反應過來並調整。如果能做到這幾點,效率會大大增加。
1.堅持數據分析師,當然這個title是可以變化的,但工作內容本身還是一脈相承的。比如我現在是在Finance部門下面的Business Finance做Finance Analyst,但我們team有專業的CFA分析師,FP&A分析師,我就是做DataAnalysis。
2.轉型為資料科學家(Data Scientist),需要惡補統計學,Python和R,還有不斷地應用到商業實踐。
3.商業分析經理 (BA Analytics Manager),該職位商業性強,溝通強,懂技術但不用去做基層的“苦力”工作,並且能夠找到得力的下屬做事。
4.資料工程師(Data Engineer),比較後端的職位,技術性強,對架構,資料底層的瞭解更深,我的理解是比較適合理工科出身,不太希望與業務端打交道,程式碼邏輯很強的童鞋。
5.諮詢師(Consultant),此職位更偏重商業分析能力+溝通能力+表達能力,這個對於硬性的技術要求不高,但軟性特別高。但好的諮詢公司待遇相當棒,招人的條件也是很高,名校背景,很高的GPA成績,自信表達能力,精准溝通等等,總之非常不容易。不過一般有一個諮詢團隊,有前段後端之分,後端(支援段)偏技術分析,前段偏表達溝通。這個職位的跨度就比較大,但是我還是鼓勵各種可能性的發生。要敢想。當然還有其他很多職位,比如資料採擷,資料視覺化工程師,產品或策略分析等等,各自有側重。
技術永遠只是手段。產生價值才是王道。這裡面涉及到諸多的能力需要不斷磨練,比如意志力,溝通能力,演講能力,好奇心,創造力,影響力等等。這些都是能不斷塑造一個好的資料分析師的重要素質。要去make the change and influence,不只停留在數字展示。
好的身體會使你擁有更多能量。職場裡面那些充滿能量,對新鮮項目感興趣,滔滔不絕做presentation的人通常都是有著很好的生活習慣,處理事情很快,吸收知識很快,願意學習瞭解新事物,堅持鍛煉的人。這個法則適用於大多職場。拼到後面其實是持久的耐力,就是不鬆懈,堅持對的事情。
別鑽牛角尖,要靈活。如果一種方法試了好久都不行,停下來,問一問,試一試別的,可能會有新的出路。職場不是一個學術的地方。我們要認真做事,但是不要追著一個小的問題不放,這樣很容易丟失掉大的東西, 負責任地講,有很多項目是半途而廢的,有很多數字不是準確的,我們要做的是順勢而為,抓住重點。Always focus on big picture.
先做傾聽者,再做思考者,然後做好的提問者,最後做實現者。這裡每一個環節都重要,先知道別人關心的是什麼,有什麼問題,然後要系統性考慮,有時候不要著急解決小問題,Focus on big picture,此外,提問出關鍵問題甚至能夠幫助stakeholder更清楚瞭解他要的是什麼,最後搞清楚了這些之後就是Action。
有意識地去跟人交流,特別是業務相關人員,以及各個條線的stakeholder,如果僅僅利用必要的時間,比如開會的時候交流彼此對業務對分析的看法,通常是不夠的。我們作為分析人員,最好要走在前面,試探性的問問題,交流想法。提升自己舉例子的能力,把複雜的東西通過簡單的描述讓別人理解很重要。
不停的總結,反覆運算。其實資料分析裡面的分支學科還是很多的,ETL, Data Cleansing, 一些基本分析模型,Data visualization等等,不管是自己做過的項目經驗,還是網上看來得好文章,或者同行交流來的新的好的內容,都可以不停的總結,試用,回饋,以此迴圈。長期來看是非常有好處的並且容易形成自己的體系。
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,期待你與我的互動!
更多精彩內容,去臉書 【數據分析那些事】查看!